Analisi bibliometrica - I docenti del DMIF
Introduzione
Che cosa è la bibliometria?
La bibliometria è una disciplina che utilizza analisi quantitative e statistiche per analizzare le pubblicazioni scientifiche e le loro relazioni.
Il progetto si focalizza sull’analisi della produzione scientifica dei docenti del dipartimento DMIF dell’Università degli Studi di Udine, per cercare di dare una stima di:
come funziona la ricerca
quali sono i settori di maggiore interesse
gli autori più prolifici.
Per supporto all’analisi ho utilizzato una libreria, Bibliometrix (Aria and Cuccurullo 2017), sviluppata da due docenti dell’Università di Napoli.
Fonte dei dati
I dati analizzati in questo progetto sono stati scaricati (ultimo download: 12/02/2024) da Scopus, uno dei principali dabatase bibliografici. Sono stati selezionati 31 autori del DMIF, tra docenti e dottorandi.
Ogni articolo del dataframe contiene svariati attributi tra cui: la lista di autori, il titolo del documento, la sorgente di pubblicazione, il tipo di documento, le parole chiavi degli autori, le references, il numero di citazioni, l’anno di pubblicazione.
Analisi bibliometrica
Analisi descrittiva del dataframe
La tabella delle informazioni principali descrive le dimensioni della raccolta in termini di numero di documenti, numero di autori, numero di fonti, numero di parole chiave, durata e numero medio di citazioni.
“docs” per autori è calcolato come rapporto tra il numero totale di autori e il numero totale di articoli.
“co-Autori” per articolo è calcolato come numero medio di co-autori per articolo.
MAIN INFORMATION ABOUT DATA
Timespan 1987 : 2024
Sources (Journals, Books, etc) 386
Documents 1251
Annual Growth Rate % 5.78
Document Average Age 11
Average citations per doc 13.63
Average citations per year per doc 1.157
References 28512
DOCUMENT CONTENTS
Keywords Plus (ID) 6244
Author's Keywords (DE) 1972
AUTHORS
Authors 1012
Author Appearances 4233
Authors of single-authored docs 17
AUTHORS COLLABORATION
Single-authored docs 77
Documents per Author 1.24
Co-Authors per Doc 3.38
International co-authorships % 32.93
Annual Scientific Production
Year Articles
1987 1
1988 1
1989 1
1990 1
1991 3
1993 4
1994 5
1995 12
1996 7
1997 10
1998 11
1999 9
2000 15
2001 17
2002 25
2003 23
2004 44
2005 29
2006 35
2007 49
2008 54
2009 60
2010 46
2011 44
2012 40
2013 32
2014 50
2015 58
2016 55
2017 60
2018 85
2019 59
2020 73
2021 62
2022 76
2023 87
2024 8
Annual Percentage Growth Rate 5.78
Most Productive Authors
Authors Articles Authors Articles Fractionalized
1 MONTANARI A 196 CHITTARO L 77.7
2 CHITTARO L 161 MONTANARI A 57.5
3 MIZZARO S 130 MIZZARO S 41.0
4 DOVIER A 118 POLICRITI A 39.8
5 POLICRITI A 109 DOVIER A 39.8
6 MICULAN M 83 MICULAN M 37.4
7 PIAZZA C 81 PIAZZA C 26.6
8 PICIARELLI C 57 LANCIA G 26.1
9 FORESTI GL 56 FRANCESCHET M 22.3
10 FONTANA F 55 BRAJNIK G 21.2
11 LANCIA G 55 FONTANA F 17.4
12 PONTELLI E 55 FORMISANO A 17.2
13 FORMISANO A 54 PICIARELLI C 16.8
14 SALA P 52 PONTELLI E 15.3
15 SCIAVICCO G 52 FORESTI GL 15.3
Top manuscripts per citations
Paper DOI TC TCperYear NTC
1 CORNIA M, 2018, IEEE TRANS IMAGE PROCESS 10.1109/TIP.2018.2851672 385 55.00 26.76
2 CHITTARO L, 2007, COMPUT EDUC 10.1016/j.compedu.2005.06.002 286 15.89 11.90
3 BUTTUSSI F, 2018, IEEE TRANS VISUAL COMPUT GRAPHICS 10.1109/TVCG.2017.2653117 276 39.43 19.18
4 CHITTARO L, 2015, IEEE TRANS VISUAL COMPUT GRAPHICS 10.1109/TVCG.2015.2391853 250 25.00 15.76
5 CHITTARO L, 2006, COMPUTER 10.1109/MC.2006.109 248 13.05 7.72
6 NADALIN F, 2012, BMC BIOINFORM 10.1186/1471-2105-13-S14-S8 245 18.85 13.74
7 PICIARELLI C, 2006, PATTERN RECOGN LETT 10.1016/j.patrec.2006.02.004 218 11.47 6.79
8 JENSEN CS, 1998, LECT NOTES COMPUT SCI 10.1007/bfb0053710 218 8.07 4.52
9 FRANCESCHET M, 2010, J INF 10.1016/j.joi.2010.06.003 182 12.13 6.45
10 FRANCESCHET M, 2010, SCIENTOMETRICS 10.1007/s11192-009-0021-2 172 11.47 6.10
11 FRANCESCHET M, 2011, COMMUN ACM 10.1145/1953122.1953146 137 9.79 6.72
12 MIZZARO S, 1998, INTERACT COMPUT 10.1016/S0953-5438(98)00012-5 136 5.04 2.82
13 BUTTUSSI F, 2008, ARTIF INTELL MED 10.1016/j.artmed.2007.11.004 127 7.47 7.45
14 BURIGAT S, 2007, INT J HUM COMPUT STUD 10.1016/j.ijhcs.2007.07.003 123 6.83 5.12
15 DOVIER A, 2004, THEOR COMPUT SCI 10.1016/S0304-3975(03)00361-X 117 5.57 5.11
Corresponding Author's Countries
Country Articles Freq SCP MCP MCP_Ratio
1 ITALY 630 0.87866 499 131 0.208
2 SWITZERLAND 12 0.01674 0 12 1.000
3 UNITED KINGDOM 11 0.01534 0 11 1.000
4 USA 9 0.01255 0 9 1.000
5 SPAIN 8 0.01116 0 8 1.000
6 DENMARK 7 0.00976 0 7 1.000
7 FRANCE 6 0.00837 0 6 1.000
8 MEXICO 5 0.00697 0 5 1.000
9 NETHERLANDS 5 0.00697 0 5 1.000
10 FINLAND 3 0.00418 0 3 1.000
11 ICELAND 3 0.00418 0 3 1.000
12 AUSTRALIA 2 0.00279 0 2 1.000
13 AUSTRIA 2 0.00279 0 2 1.000
14 CYPRUS 2 0.00279 0 2 1.000
15 GERMANY 2 0.00279 0 2 1.000
SCP: Single Country Publications
MCP: Multiple Country Publications
Total Citations per Country
Country Total Citations Average Article Citations
1 ITALY 10704 16.99
2 DENMARK 224 32.00
3 USA 206 22.89
4 UNITED KINGDOM 195 17.73
5 SPAIN 112 14.00
6 FRANCE 91 15.17
7 MEXICO 80 16.00
8 SOUTH AFRICA 64 64.00
9 CYPRUS 63 31.50
10 NETHERLANDS 57 11.40
11 FINLAND 37 12.33
12 AUSTRALIA 34 17.00
13 SWITZERLAND 30 2.50
14 ICELAND 22 7.33
15 POLAND 22 11.00
Most Relevant Sources
Sources
1 LECTURE NOTES IN COMPUTER SCIENCE (INCLUDING SUBSERIES LECTURE NOTES IN ARTIFICIAL INTELLIGENCE AND LECTURE NOTES IN BIOINFORMATICS)
2 CEUR WORKSHOP PROCEEDINGS
3 THEORETICAL COMPUTER SCIENCE
4 LEIBNIZ INTERNATIONAL PROCEEDINGS IN INFORMATICS LIPICS
5 ACM INTERNATIONAL CONFERENCE PROCEEDING SERIES
6 ELECTRONIC PROCEEDINGS IN THEORETICAL COMPUTER SCIENCE EPTCS
7 ELECTRONIC NOTES IN THEORETICAL COMPUTER SCIENCE
8 EURO ADVANCED TUTORIALS ON OPERATIONAL RESEARCH
9 INFORMATION AND COMPUTATION
10 INTERNATIONAL JOURNAL OF HUMAN COMPUTER STUDIES
11 COMMUNICATIONS IN COMPUTER AND INFORMATION SCIENCE
12 THEORY AND PRACTICE OF LOGIC PROGRAMMING
13 FUNDAMENTA INFORMATICAE
14 JOURNAL OF LOGIC AND COMPUTATION
15 SPRINGERBRIEFS IN COMPUTER SCIENCE
Articles
1 245
2 115
3 31
4 28
5 26
6 25
7 24
8 16
9 15
10 14
11 13
12 13
13 12
14 10
15 10
Most Relevant Keywords
Author Keywords (DE) Articles Keywords-Plus (ID) Articles
1 EVALUATION 30 COMPUTER CIRCUITS 121
2 MODEL CHECKING 26 SEMANTICS 99
3 MOBILE DEVICES 24 LOGIC PROGRAMMING 96
4 VIRTUAL REALITY 24 TEMPORAL LOGIC 95
5 INTERVAL TEMPORAL LOGIC 21 ARTIFICIAL INTELLIGENCE 91
6 CROWDSOURCING 18 INFORMATION RETRIEVAL 71
7 DEEP LEARNING 18 AUTOMATA THEORY 68
8 COMPLEXITY 17 INTERVAL TEMPORAL LOGIC 67
9 DECIDABILITY 15 ALGORITHMS 64
10 BISIMULATION 14 COMPUTABILITY AND DECIDABILITY 61
11 MACHINE LEARNING 14 MODEL CHECKING 60
12 ANSWER SET PROGRAMMING 13 COMPUTER SCIENCE 55
13 COMPUTATIONAL COMPLEXITY 13 VIRTUAL REALITY 55
14 TREC 13 FORMAL LOGIC 52
15 TRAINING 12 COMPUTATION THEORY 50
Prof. Montanari autore più produttivo con 196 articoli
Italia paese più produttivo, alcuni autori erano in altri paesi (esempio Svizzera, UK) quando hanno pubblicato
anno più produttivo: 2023 con 87 pubblicazioni
anno con media citazioni in articoli più alta: 2018
anno con più citazioni: 1987
Documenti per tipo
DT n
1 CONFERENCE PAPER 703
2 ARTICLE 446
3 BOOK CHAPTER 41
4 EDITORIAL 40
5 REVIEW 15
6 ERRATUM 2
7 BOOK 1
8 DATA PAPER 1
9 NOTE 1
10 SHORT SURVEY 1
Il tipo di pubblicazione più presente è il conference paper, seguito da articoli e capitoli di libro.
Analisi delle citazioni
Citazioni globali
La citazione globale rappresenta il numero totale di citazioni ricevute da un documento da tutte le pubblicazioni indicizzate in una fonte - in questo caso Scopus.
Articoli più citati:
[,1]
MOSZKOWSKI B., REASONING ABOUT DIGITAL CIRCUITS, (1983) 36
ALLEN J.F., MAINTAINING KNOWLEDGE ABOUT TEMPORAL INTERVALS, COMMUNICATIONS OF THE ACM, 26, 11, PP. 832-843, (1983) 32
BRESOLIN D., GORANKO V., MONTANARI A., SCIAVICCO G., PROPOSITIONAL INTERVAL NEIGHBORHOOD LOGICS: EXPRESSIVENESS, DECIDABILITY, AND UNDECIDABLE EXTENSIONS, ANNALS OF PURE AND APPLIED LOGIC, 161, 3, PP. 289-304, (2009) 25
VENEMA Y., A MODAL LOGIC FOR CHOPPING INTERVALS, JOURNAL OF LOGIC AND COMPUTATION, 1, 4, PP. 453-476, (1991) 25
HALPERN J., SHOHAM Y., A PROPOSITIONAL MODAL LOGIC OF TIME INTERVALS, JOURNAL OF THE ACM, 38, 4, PP. 935-962, (1991) 23
VENEMA Y., EXPRESSIVENESS AND COMPLETENESS OF AN INTERVAL TENSE LOGIC, NOTRE DAME JOURNAL OF FORMAL LOGIC, 31, 4, PP. 529-547, (1990) 23
HALPERN J.Y., SHOHAM Y., A PROPOSITIONAL MODAL LOGIC OF TIME INTERVALS, JOURNAL OF THE ACM, 38, 4, PP. 935-962, (1991) 21
HILLSTON J., A COMPOSITIONAL APPROACH TO PERFORMANCE MODELLING, (1996) 18
ALLEN J.F., MAINTAINING KNOWLEDGE ABOUT TEMPORAL INTERVALS, COMMUN. ACM, 26, 11, PP. 832-843, (1983) 17
BRESOLIN D., MONTANARI A., SCIAVICCO G., AN OPTIMAL DECISION PROCEDURE FOR RIGHT PROPOSITIONAL NEIGHBORHOOD LOGIC, JOURNAL OF AUTOMATED REASONING, 38, 1-3, PP. 173-199, (2007) 16
Vediamo che 2 articoli del Profeessor Montanari sono tra i più citati.
Per ottenere i primi autori più frequentemente citati:
[,1]
MONTANARI A 1100
ET AL 980
SCIAVICCO G 449
DOVIER A 409
MIZZARO S 393
POLICRITI A 380
SALA P 380
CHITTARO L 357
PONTELLI E 348
BRESOLIN D 345
GORANKO V 292
MICULAN M 279
PIAZZA C 253
PERON A 242
MOLINARI A 198
Vediamo che gli autori più frequentemente citati sono Prof. Montanari, Prof. Dovier, Prof. Mizzaro e Prof. Policriti.
Classifica di dominanza degli autori
La funzione dominanza calcola la classifica di dominanza degli autori come proposto da Kumar & Kumar, 2008.
Il fattore di dominanza è un rapporto che indica la frazione di articoli con più autori in cui uno studioso compare come primo autore.
Author Dominance Factor Tot Articles Single-Authored Multi-Authored First-Authored Rank by Articles Rank by DF
1 CHITTARO L 0.54609929 161 20 141 77 2 1
2 DOVIER A 0.34210526 118 4 114 39 4 2
3 PICIARELLI C 0.28571429 57 1 56 16 8 3
4 FONTANA F 0.28301887 55 2 53 15 10 4
5 MICULAN M 0.24358974 83 5 78 19 6 5
6 MONTANARI A 0.13846154 196 1 195 27 1 6
7 POLICRITI A 0.12962963 109 1 108 14 5 7
8 PIAZZA C 0.11111111 81 0 81 9 7 8
9 MIZZARO S 0.09600000 130 5 125 12 3 9
10 FORESTI GL 0.07142857 56 0 56 4 9 10
Notiamo che nessuno è stato primo autore di tutti gli articoli pubblicati.
H-index degli autori
L’h-index è una metrica a livello di autore che cerca di misurare sia la produttività che l’impatto citazionale delle pubblicazioni.
L’indice si basa sull’insieme degli articoli più citati dello scienziato e sul numero di citazioni ricevute in altre pubblicazioni. L’indice è strutturato per quantificare mediante un singolo indice numerico non solo la produzione, ma anche l’influenza di uno scienziato, distinguendolo da chi avesse pubblicato molti articoli ma di scarso interesse.
Quindi uno scienziato ha un indice n se almeno n lavori tra quelli che ha pubblicato sono stati citati almeno n volte ciascuno.
L’indice è definito in modo tale che sull’insieme dato di articoli, ordinati in ordine decrescente di citazioni ricevute, il valore dell’indice-g è assegnato quando i primi g articoli hanno ricevuto cumulativamente \(g^2\) citazioni. \[g^2 \leq \sum_{i \leq g} c_i\]
L’ M-index è definito come h/n, dove h è l’ H-index e n è il numero di anni trascorsi dalla prima pubblicazione del ricercatore.
H-index dei primi 10 autori più produttivi (in questa raccolta):
Element h_index g_index m_index TC NP PY_start
1 CHITTARO L 39 63 1.1470588 4684 161 1991
2 MONTANARI A 22 35 0.6875000 2058 196 1993
3 MIZZARO S 20 33 0.7142857 1362 130 1997
4 POLICRITI A 19 35 0.5428571 1552 109 1990
5 DOVIER A 18 29 0.6666667 1197 118 1998
6 MICULAN M 16 23 0.5161290 695 83 1994
7 PICIARELLI C 16 28 0.8000000 901 57 2005
8 PIAZZA C 15 27 0.6000000 854 81 2000
9 FORESTI GL 14 27 0.7000000 822 56 2005
10 FONTANA F 8 12 0.5333333 245 55 2010
Gli autori con l’H-index più alto sono i Prof. Chittaro, Prof. Montanari e Prof. Mizzaro.
Produttività dei Top-Autori nel tempo
Calcolo e tracciamento della produzione degli autori (in termini di numero di pubblicazioni e di citazioni totali all’anno) nel tempo.
Notiamo che nel 2017 il Professor Mizzaro ha pubblicato ben 19 articoli.
Author year freq TC TCpY
1 MIZZARO S 2017 19 140 17.5
Stima dei coefficienti della Legge di Lotka
La legge di Lotka descrive la frequenza di pubblicazione degli autori in un determinato campo come una legge quadratica inversa, in cui il numero di autori che pubblicano un certo numero di articoli è un rapporto fisso rispetto al numero di autori che pubblicano un singolo articolo.
Sia \(X\) il numero di pubblicazioni, \(Y\) il numero di autori con \(X\) pubblicazioni e \(\beta\) una costante che dipende dal campo specifico. La legge di Lotka afferma che \(Y / X^{\beta}\).
Nella pubblicazione originale Lotka sosteneva che \(\beta=2\). Ricerche successive hanno dimostrato che \(\beta\) varia a seconda della disciplina.
Significa quindi che pochi autori contribuiscono alla maggior parte dei lavori e molti o la maggior parte di essi contribuiscono a poche pubblicazioni.
Viene stimato il coefficiente \(\beta\) della collezione bibliografica e valutata, attraverso un test statistico, la somiglianza di questa distribuzione empirica con quella teorica.
N.Articles N.Authors Freq
1 1 645 0.637351779
2 2 134 0.132411067
3 3 51 0.050395257
4 4 36 0.035573123
5 5 19 0.018774704
6 6 14 0.013833992
7 7 9 0.008893281
8 8 12 0.011857708
9 9 11 0.010869565
10 10 12 0.011857708
La tabella mostra la distribuzione osservata della produttività scientifica. Notiamo che già dopo i primi 8 la legge non vale.
Coefficiente beta:
[1] 1.132216
Bontà di adattamento:
[1] 0.7852343
P-value test a due campioni:
[1] 0.000000000001162181
Il coefficiente Beta stimato è 1,13, con una bontà di adattamento pari a 0,78. Il test di Kolmogorov-Smirnoff (utilizzato per confrontare un campione con una distribuzione di riferimento) a due campioni fornisce un valore di 0.000000000001162181 che significa che c’è una differenza significativa tra la distribuzione osservata e quella teorica di Lotka.
Confronto graficamente le due distribuzioni:
Matrici di rete bibliografica
Gli attributi del paper sono collegati tra loro attraverso il paper stesso: autore/i alla rivista, parole chiave alla data di pubblicazione, ecc. Alcune delle analisi descrittive viste in precedenza si possono visualizzare attraverso reti bipartite.
Reti bipartite
Queste connessioni di diversi attributi generano reti bipartite che possono essere rappresentate come matrici rettangolari (Papers x Attributi).
Rete Paper x Fonte di pubblicazione:
L’oggetto è una matrice binaria rettangolare che rappresenta una rete bipartita in cui le righe e le colonne sono, in questo caso, rispettivamente papers e fonti.
L’elemento generico \(bip_{ij}\) è 1 se il paper i è stato pubblicato nella fonte j, 0 altrimenti.
La somma della colonna j-esima \(bip_j\) rappresenta il numero di papers pubblicati nella fonte j.
Fonti di pubblicazione più rilevanti:
LECTURE NOTES IN COMPUTER SCIENCE (INCLUDING SUBSERIES LECTURE NOTES IN ARTIFICIAL INTELLIGENCE AND LECTURE NOTES IN BIOINFORMATICS)
245
CEUR WORKSHOP PROCEEDINGS
115
THEORETICAL COMPUTER SCIENCE
31
LEIBNIZ INTERNATIONAL PROCEEDINGS IN INFORMATICS, LIPICS
28
ACM INTERNATIONAL CONFERENCE PROCEEDING SERIES
26
Rete degli autori: paper x autore, conta quanti articoli fatti da autori
MONTANARI A CHITTARO L MIZZARO S DOVIER A POLICRITI A
196 161 130 118 109
Accoppiamento bibliografico - autori
Le pubblicazioni scientifiche contengono riferimenti ad altri lavori scientifici. Questo genera un’altra rete, quella delle reti di accoppiamento o co-citazioni.
Due autori sono accoppiati bibliograficamente se almeno una fonte citata compare nelle loro pubblicazioni.
Rete di accoppiamento: \[B = A\cdot A^T\] dove A è una rete bipartita. Due autori sono collegati da un arco nella rete se citano insieme uno o più documenti.
L’elemento \(b_{i,j}\) indica quanti accoppiamenti bibliografici esistono tra i e j. La forza dell’accoppiamento di due autori, i e j, è definita dal numero di riferimenti che gli autori hanno in comune.
L’accoppiamento bibliografico tra autori è una misura di quanto due autori condividono riferimenti comuni nelle loro pubblicazioni. In altre parole, quanti autori citano gli stessi lavori nelle loro ricerche.
vertex cluster btw_centrality clos_centrality pagerank_centrality
4 dovier a 1 5.93614719 0.03333333 0.05018926
5 policriti a 1 1.13648296 0.03125000 0.04440508
7 piazza c 1 4.98330836 0.03333333 0.04987707
11 pontelli e 1 5.02023810 0.03225806 0.04775414
12 formisano a 1 0.44835165 0.02857143 0.03713586
13 sala p 1 0.23168498 0.02941176 0.03938667
14 sciavicco g 1 10.18687979 0.03571429 0.05558548
18 peron a 1 0.48926074 0.03030303 0.04183544
19 bresolin d 1 0.23168498 0.02941176 0.03938667
20 bozzelli l 1 0.07142857 0.02857143 0.03697284
21 della monica d 1 1.13648296 0.03125000 0.04440508
23 molinari a 1 0.48926074 0.03030303 0.04183544
24 monica dd 1 3.59759407 0.03225806 0.04725540
25 goranko v 1 0.90479798 0.02941176 0.03960194
3 mizzaro s 2 6.67976190 0.02857143 0.04099937
8 piciarelli c 2 0.49682540 0.02439024 0.02461762
9 foresti gl 2 6.12301587 0.02631579 0.03510770
15 roitero k 2 3.28809524 0.02702703 0.03534667
16 scagnetto i 2 0.11111111 0.02325581 0.01909874
17 serra g 2 3.08690476 0.02631579 0.03279471
22 demartini g 2 0.10000000 0.02272727 0.01668790
1 montanari a 3 20.84640360 0.03846154 0.06179634
2 chittaro l 3 48.31068931 0.04000000 0.06733006
6 miculan m 3 6.09358974 0.02857143 0.03912209
10 fontana f 4 0.00000000 0.02173913 0.01147244
Analisi della rete
Il nodo più centrale della rete risulta essere il Professor Chittaro, con i valori più alti di tutti in queste tre metriche (ma non il grado) 1.
Il secondo nodo più centrale è il Professor Montanari, il quale ha il secondo valore più alto nelle tre metriche e il grado più alto.
Il Professor Sciavicco si posiziona in alto per la betweenness centrality, indicando un ruolo di ponte tra diverse comunità di autori.
Main statistics about the network
Size 1012
Density 0.014
Transitivity 0.344
Diameter 5
Degree Centralization 0.176
Average path length 2.906
Densità: indica una rete sparsa.
Transitività: livello di clustering moderato.
Centralizzazione del grado: misura la concentrazione dei collegamenti nella rete, significa che la distribuzione dei gradi non è completamente uniforme, con alcuni autori che hanno un numero di collegamenti significativamente maggiore rispetto ad altri.
Co-citazione bibliografica
Si parla di co-citazione di due articoli quando entrambi sono citati in un terzo articolo. La co-citazione è la frequenza con cui due documenti sono citati insieme da altri documenti.
Rete di co-citazione: \[C=A^T \cdot A\] dove A è una rete bipartita. Due documenti sono collegati da un arco nella rete se sono citati insieme in uno o più documenti.
In altre parole, l’elemento diagonale \(c_i\) è il numero di citazioni locali del riferimento i. L’elemento \(c_{i,j}\) rappresenta quante volte i documenti \(i\) e \(j\) sono stati co-citati insieme.
Node Cluster Betweenness Closeness PageRank
1 clarke e.m. 1999 1 210.0000000 0.003663004 0.020397457
2 lafferriere g. 2000 1 0.0000000 0.003246753 0.031485284
3 tarski a. 1951 1 0.0000000 0.003246753 0.030037538
4 alur r. 1994 1 286.5000000 0.005617978 0.026729357
5 ghosh r. 1 0.0000000 0.003246753 0.024420484
6 rogers r.w. 1983 2 0.0000000 0.100000000 0.024212573
7 bandura a. 1997 2 0.0000000 0.100000000 0.021968922
8 fogg b.j. 2003 2 0.0000000 0.100000000 0.017648292
9 moszkowski b. 1983 3 98.3727315 0.005681818 0.041478590
10 allen j.f. 1983-1 3 361.6044508 0.006493506 0.033151916
11 venema y. 1990 3 29.3785991 0.005494505 0.026168383
12 halpern j.y. 1991-1 3 1.4930439 0.005154639 0.025345642
13 allen j.f. 1983-2 3 0.0000000 0.002976190 0.018094210
14 marcinkowski j. 2014 3 4.9413324 0.005263158 0.025329854
15 halpern j.y. 1991-2 3 0.0000000 0.002976190 0.016298794
16 molinari a. 3 3.5243186 0.005208333 0.025682541
17 molinari a. 2016 3 0.9708447 0.005154639 0.013607977
18 molinari a. 2015-1 3 2.8200446 0.005208333 0.023053104
19 bresolin d. 2014-1 3 0.0000000 0.002941176 0.011801651
20 bresolin d. 2014-2 3 0.8644189 0.005154639 0.019314653
21 lomuscio a. 2014 3 1.4144450 0.005154639 0.021800866
22 molinari a. 2015-2 3 2.1157705 0.005208333 0.021604896
23 muscettola n. 1994 4 144.0000000 0.006024096 0.015295009
24 cialdea mayer m. 2016 4 144.0000000 0.006024096 0.015295009
25 bresolin d. 2009 5 237.5879882 0.006172840 0.030211943
26 venema y. 1991 5 50.0520001 0.005882353 0.028459575
27 halpern j. 1991 5 23.5834095 0.005617978 0.026955112
28 bresolin d. 2007 5 9.6783785 0.005617978 0.021757428
29 goranko v. 2003 5 4.0171131 0.005555556 0.021397753
30 otto m. 2001 5 2.8795630 0.005555556 0.018367399
31 goranko v. 2004 5 3.0559092 0.005617978 0.018573971
32 allen j. 1983 5 0.0000000 0.002994012 0.007995417
33 blackburn p. 2002 5 1.9459772 0.005555556 0.013432717
34 bresolin d. 2010 5 9.1996612 0.005813953 0.011253145
35 hillston j. 1996 6 137.0000000 0.003076923 0.036147636
36 honsell f. 7 0.0000000 1.000000000 0.021276596
37 aczel p. 1988 8 0.0000000 0.003003003 0.006436220
38 baral c. 2003 9 2.0000000 0.250000000 0.031670335
39 milner r. 1989 10 0.0000000 0.002770083 0.008613635
40 saraswat v.a. 1993 11 0.0000000 0.002777778 0.022559520
41 dovier a. 12 0.0000000 0.166666667 0.010882856
42 miculan m. 1997 13 0.0000000 1.000000000 0.021276596
43 alzetta g. 2018 14 0.0000000 0.002770083 0.014035780
44 jaffar j. 1994 15 0.0000000 0.166666667 0.010882856
45 marriott k. 1998 16 2.0000000 0.250000000 0.031670335
46 paige r. 1987 17 191.0000000 0.003367003 0.013360655
47 wilkinson d.j. 2006 18 0.0000000 0.002777778 0.022559520
Analisi della rete
Il nodo con la centralità di Betweennees più alta è Allen j.f. 1983-1, con 361.6. Il nodo con la centralità di PageRank più alta è Moszkowski b. 1983, con 0.0414.
L’analisi evidenzia la presenza di diverse comunità di ricerca con interessi tematici specifici.
La centralità degli autori varia a seconda del cluster di appartenenza e delle metriche considerate.
Alcuni autori, come Moszkowski b. 1983, Allen j.f. 1983-1, Halpern j.y. 1991-1, Bresolin d. 2009 e Venema y. 1991 presentano valori di centralità più alti rispetto ad altri, suggerendo un ruolo potenzialmente più rilevante nella rete.
Main statistics about the network
Size 28248
Density 0.002
Transitivity 0.874
Diameter 24
Degree Centralization 0.025
Average path length 7.712
Densità: indica una rete molto sparsa, la maggior parte delle possibili connessioni tra nodi non esiste, comune nelle reti di co-citazione perché non tutti gli autori citano tutti gli altri autori.
Transitività: valore molto alto, suggerisce la presenza di comunità di ricerca ben definite, dove gli autori tendono a citare altri autori appartenenti alla stessa comunità.
Centralizzazione del grado: misura la concentrazione dei collegamenti nella rete, il valore basso ottenuto indica che i collegamenti sono distribuiti più uniformemente tra i nodi. Questo è coerente con la bassa densità della rete, dove nessun nodo detiene la maggior parte delle connessioni.
Collaborazione autori
La rete di collaborazione scientifica è una rete in cui i nodi sono gli autori e i legami sono le coautorialità, in quanto quest’ultima è una delle forme più documentate di collaborazione scientifica (Glanzel, 2004).
Una rete di collaborazione tra autori può essere ottenuta utilizzando la formulazione generale: \[AC=A^T \cdot A\] dove A è una rete bipartita Papers x Autori.
L’elemento diagonale \(ac_i\) è il numero di papers di cui il ricercatore \(i\) è autore o coautore.
vertex cluster btw_centrality clos_centrality pagerank_centrality
2 chittaro l 1 104.0937022 0.01724138 0.04010246
6 miculan m 1 27.7710751 0.01449275 0.02774521
8 piciarelli c 1 2.5277778 0.01234568 0.02740807
9 foresti gl 1 40.7595238 0.01538462 0.05193366
10 fontana f 1 2.0000000 0.01098901 0.01837675
17 scagnetto i 1 33.0877675 0.01470588 0.03271515
18 serra g 1 81.8256989 0.01587302 0.04862541
19 brajnik g 1 5.7349335 0.01408451 0.02630014
20 ranon r 1 5.6619048 0.01190476 0.01849130
25 micheloni c 1 1.4761905 0.01234568 0.02680649
28 tasso c 1 20.1095367 0.01515152 0.04362959
4 dovier a 2 12.9590804 0.01298701 0.03419016
5 policriti a 2 63.0502603 0.01408451 0.06050805
7 piazza c 2 6.4073260 0.01298701 0.03356030
11 lancia g 2 0.0000000 0.01010101 0.01071465
12 pontelli e 2 0.3333333 0.01041667 0.02863919
13 formisano a 2 0.0000000 0.01030928 0.02261280
1 montanari a 3 149.7373916 0.01785714 0.06829667
14 sala p 3 7.6666667 0.01369863 0.03925775
15 sciavicco g 3 65.6352227 0.01587302 0.03266792
21 peron a 3 3.9833333 0.01298701 0.03335311
22 bresolin d 3 0.0000000 0.01315789 0.02139253
23 gigante n 3 11.9320095 0.01449275 0.03294865
24 bozzelli l 3 0.0000000 0.01219512 0.02150901
27 geatti l 3 29.4044085 0.01470588 0.02748925
3 mizzaro s 4 26.0528726 0.01315789 0.04851419
16 roitero k 4 5.2903123 0.01190476 0.03181247
26 della mea v 4 6.2093599 0.01176471 0.03215018
29 demartini g 4 5.2903123 0.01190476 0.03181247
30 maddalena e 4 0.0000000 0.00990099 0.02643640
Sono presenti 4 clusters ed in ognuno di essi è presente almeno un nodo con dei valori alti di centralità, il che indica un ruolo di connessione e influenza all’interno del cluster.
cluster 1: Prof. Chittaro e Prof. Serra
cluster 2: Prof. Dovier e Prof. Policriti
cluster 3: Prof. Montanari
cluster 4: Prof. Mizzaro e Prof. Della Mea
Main statistics about the network
Size 1012
Density 0.009
Transitivity 0.555
Diameter 7
Degree Centralization 0.116
Average path length 3.772
Densità: rete molto sparsa.
Transitività: livello di clustering elevato.
Centralizzazione del grado: distribuzione dei gradi non è completamente uniforme, con alcuni autori che hanno un numero di collegamenti significativamente maggiore rispetto ad altri.
Analisi Paesi
Rete Paesi
Grafo bipartito Papers x Paesi autori
ITALY USA UNITED KINGDOM SPAIN AUSTRALIA
1244 125 64 58 44
Quasi la totalità degli autori proviene dall’Italia / ha pubblicato quando si trovava in Italia.
Collaborazione tra Paesi
node degree
italy italy 1.0000000000
usa usa 0.1472312704
united kingdom united kingdom 0.0824104235
spain spain 0.0723127036
australia australia 0.0557003257
france france 0.0517915309
denmark denmark 0.0413680782
switzerland switzerland 0.0361563518
germany germany 0.0348534202
finland finland 0.0224755700
canada canada 0.0175895765
netherlands netherlands 0.0166123779
iceland iceland 0.0153094463
south africa south africa 0.0136807818
sweden sweden 0.0127035831
turkey turkey 0.0117263844
hong kong hong kong 0.0117263844
new zealand new zealand 0.0097719870
portugal portugal 0.0094462541
czech republic czech republic 0.0091205212
israel israel 0.0081433225
macedonia macedonia 0.0078175896
romania romania 0.0068403909
austria austria 0.0061889251
serbia serbia 0.0061889251
poland poland 0.0058631922
belgium belgium 0.0058631922
japan japan 0.0055374593
china china 0.0048859935
india india 0.0048859935
north macedonia north macedonia 0.0045602606
ireland ireland 0.0045602606
lithuania lithuania 0.0045602606
slovenia slovenia 0.0035830619
united arab emirates united arab emirates 0.0032573290
chile chile 0.0029315961
saudi arabia saudi arabia 0.0029315961
greece greece 0.0026058632
iran iran 0.0026058632
korea korea 0.0026058632
bulgaria bulgaria 0.0016286645
egypt egypt 0.0013029316
hungary hungary 0.0009771987
mexico mexico 0.0009771987
Vediamo che l’Italia è il paese con il grado più alto, il che indica che è il Paese con il maggior numero di collaborazioni all’interno della rete. Seguono USA, UK e Spagna.
Rete storica delle citazioni dirette
La mappa storiografica è un grafo proposto da E. Garfield (2004) per rappresentare una mappa di rete cronologica delle citazioni dirette più rilevanti risultanti da una raccolta bibliografica.
La funzione genera una matrice cronologica della rete di citazioni dirette
Vediamo una citazione da un articolo di Kevin Roitero, PhD del 2020 ad un articolo del Professor Mizzaro del 2007, più una serie di citazioni tra articoli dei Professori Molinari/Montanari/Bresolin tra il 2016 e il 2003.
Analisi parole chiave
Rete parole chiave
Rete Bipartita Papers x Keyword Scopus
Ogni paper ha associate delle parole chiave dal database di Scopus: le tre più presenti sono Computer Circuits, Semantics e Temporal Logic.
Word cloud
Dai dati della rete bipartita è possibile creare un df con le frequenze delle parole, da cui si può ricavare una word cloud.
Rete co-occorrenze parole chiave
vertex cluster btw_centrality clos_centrality pagerank_centrality
6 information retrieval 1 19.5440476 0.02127660 0.02312126
8 algorithms 1 12.9112554 0.02083333 0.04849195
12 virtual reality 1 18.6545455 0.02000000 0.01642496
17 mobile devices 1 71.5831169 0.02380952 0.01835430
19 computer simulation 1 47.1402597 0.02272727 0.03406490
20 deep learning 2 1.0833333 0.01369863 0.01221384
23 human 2 0.2500000 0.01666667 0.03684086
24 humans 2 2.1166667 0.01724138 0.03437656
25 article 2 14.5251082 0.01886792 0.03018056
1 computer circuits 3 0.0000000 0.01388889 0.08820886
2 semantics 3 0.5928571 0.01538462 0.06530626
3 logic programming 3 18.3980519 0.01639344 0.05627130
4 temporal logic 3 2.8190476 0.01612903 0.07092624
7 automata theory 3 3.7159091 0.01666667 0.04178205
9 computability and decidability 3 10.3902597 0.01754386 0.04372405
10 model checking 3 1.7083333 0.01639344 0.04777148
13 formal logic 3 0.4837662 0.01515152 0.04409430
14 computation theory 3 29.0920996 0.02000000 0.04036151
15 computer programming languages 3 3.3187229 0.01960784 0.03986053
21 algebra 3 0.8333333 0.01388889 0.03245140
22 calculations 3 7.7143939 0.01724138 0.02372588
5 artificial intelligence 4 5.2016234 0.01851852 0.05125958
11 computer science 4 22.4591991 0.01923077 0.03355208
16 problem solving 4 28.2877706 0.02127660 0.03360397
18 mathematical models 4 6.1202381 0.01886792 0.03303133
Ci sono quattro cluster di parole chiave:
ognuno contiene parole di diversi campi di ricerca
il primo cluster presenta la btw_centrality media più alta; può significare che le parole sono concetti chiave in diverse discipline informatiche. Inoltre, la posizione centrale del cluster 1 nella rete di co-occorrenza suggerisce che funge da ponte tra diverse aree dell’informatica.
nel terzo cluster, la parola “computation theory” ha il valore di betwenness e closeness più alto; potrebbe fungere da concetto chiave che collega diverse aree dell’informatica teorica.
nel quarto cluster è presente la parola “problem solving” che ha il valore più alto di btw_centrality, suggerendo che potrebbe essere un concetto chiave che collega l’intelligenza artificiale e l’informatica con campi applicativi che richiedono la soluzione di problemi.
Mappa tematica
L’analisi delle co-parole chiave disegna cluster di parole chiave. Questi vengono considerati come temi, la cui densità e centralità possono essere utilizzate per classificare i temi e mapparli in un diagramma bidimensionale.
La mappa tematica è appunto basata sull’analisi della rete delle parole e sul clustering e si possono analizzare i temi in base al quadrante in cui sono collocati:
quadrante in alto a destra: temi motori (cluster molto denso e molto centrale);
quadrante in basso a destra: temi di base (cluster poco denso ma molto centrae);
quadrante in basso a sinistra: temi emergenti o in via di estinzione (cluster poco denso e poco centrale);
quadrante in alto a sinistra: temi molto specializzati/di nicchia (cluster molto denso e poco centrale).
# A tibble: 45 × 4
# Groups: Cluster [9]
Cluster Words Occurrences n.rel
<dbl> <chr> <dbl> <dbl>
1 1 algorithms 63 0.0740
2 1 computer simulation 37 0.0435
3 1 deep learning 31 0.0364
4 1 database systems 30 0.0353
5 1 computers 28 0.0329
6 2 information retrieval 71 0.0810
7 2 virtual reality 53 0.0604
8 2 mobile devices 46 0.0525
9 2 user interfaces 38 0.0433
10 2 human computer interaction 37 0.0422
# ℹ 35 more rows
La colonna r.rel si riferisce alle frequenze relative delle parole all’interno del cluster di appartenenza.
Ad esempio, il cluster in cui spicca la parola “algorithms” è nel quadrante dei temi di base, mentre “crowdsourcing” si trova nel quadrante dei temi emergenti o in declino. Il cluster con “finite element method” si trova nel quadrante dei temi di nicchia.
Conclusione
All’interno del dipartimento operano gruppi di ricerca che si distinguono per una notevole produttività scientifica, la quale si traduce in un significativo apporto alla letteratura di settore. Pur focalizzandosi su ambiti di ricerca differenti, i gruppi collaborano attivamente tra loro, favorendo lo scambio di conoscenze e competenze.
Tutte le nozioni viste a lezione sono utilizzate ma non ri-definite.↩︎